查看原文
其他

打破“两堵墙”,存算一体芯片蓄势待发 | 星科技•芯片半导体

联想之星 2023-10-20


前沿科技

芯片半导体





近年来,集成电路领域的“后摩尔时代”技术引发了广泛关注。“存算一体”作为“后摩尔时代”的一大发展方向,有望解决当前集成电路系统中所面临的“存储墙”和“功耗墙”问题,具有重要的战略价值。


01

突破AI算力瓶颈

根据集微网的介绍,所谓“存算一体”,是指将传统以计算为中心的架构转变为以数据为中心的架构,直接利用存储器进行数据处理,从而把数据存储与计算融合在同一芯片中,极大提高计算并行度与能量效率,特别适用于深度学习神经网络领域,如可穿戴设备、移动设备、智能家居等场景。


“存算一体”的关键在于突破了传统的冯·诺依曼计算架构下,数据存储与数据处理相互分离,存储器与处理器之间通过数据总线进行数据传输的速率和功耗瓶颈。


速率方面,数据总线的有限带宽严重制约处理器的性能与效率,AI运算需要1PB/s的运算速率,而作为缓存的SRAM速度仅有100TB/s,主存DRAM的速度更是仅有1TB/s,每一级存储之间都形成了一道“存储墙”,制约着系统整体的运算速率。


功耗方面,数据在存储器与处理器之间的频繁迁移带来严重的传输功耗问题。在摩尔定律时代,这一功耗尚可随着晶体管尺寸的减小等比例地缩小,称为“登纳德微缩”。然而,当“后摩尔时代”芯片的特征尺寸进入7nm以后时,量子效应所导致的漏电使得单位功耗密度快速上升,由于数据传输所导致的静态功耗越来越成为芯片发展的制约,形成“功耗墙”。芯片的设计无法再依靠尺寸微缩取得更好的性能和能效,“存算一体”架构开始显现出其独特优势。


存算一体概念的提出最早可以追溯到上个世纪七十年代,斯坦福研究所的Kautz等人于1969年提出了存算一体的概念,期望直接利用内存做一些简单的计算功能,减小数据在处理器与存储器之间的搬移。


2010年以来,随着数据量不断增大以及3D内存等技术的出现,存算一体的概念重新得到人们的广泛关注,并开始应用于商业级DRAM主存当中。尤其从2015年开始,随着云计算、物联网、人工智能等大数据应用的兴起,存算一体得到国内外学术界与产业界的广泛研究与应用。如今,存算一体的性能功耗优势已经被初步证明。


02

存算一体的多种技术方案


半导体行业观察认为,由于“墙〞的问题存在已久,业界已形成多种解决思路,包括对计算或存储部件本身的性能提是升,以及存与算的协同优化,即存算一体技术。


根据存储与计算的距离远近,半导体行业观察将广义存算一体的技术方案分为三大类,分别是近存计算 (Processing Near Memory, PNM)、存内处理(Processing ln Memory.PlM) 和行内计算 (Computing in Memory, CIM)。存内计算即狭义的存算一体。


1、近存计算 (PNM)


近存计算通过芯片封装和板卡组装等方式,将存储单元和计算单元集成,增加访存带宽、减少数据搬移,提升整体计算效率。近存计算仍是存算分离架构,本质上计算操作由位于存储外部、独立的计算单元完成,其技术成熟度较高,主要包括存储上移、计算下移两种方式。


近存计算已应用于人工智能、大数据、边缘计算等场景,因其基本保持原有计算架构,产品化方案可较快投入使用。


2、存内处理(PIM)


存内处理是在芯片制造的过程中,将存和算集成在同一个晶粒 (Die)中,使存储器本身具备了一定算的能力。存内处理本质上仍是存算分离,相比于近存计算,存”与“算”距离更近。当前存内处理方案大多在内存(DRAM)芯片中实现部分数据处理,较为典型的产品形态为HBM-PIM和PIM-DIMM,在DRAM Die中内置处理单元,提供大吞吐低延迟片上处理能力,可应用于语音识别、数据库索引搜索、基因匹配等场景。


基于DRAM的PIM方案示例


3、存内计算(CIM)


存内计算即狭义的存算一体,在芯片设计过程中,不再区分存储单元和计算单元,真正实现存算融合。存内计算是计算新范式的研究热点,其本质是利用不同存储介质的物理特性,对存储电路进行重新设计使其同时具备计算和存储能力,直接消除“存〞“算〞界限,使计算能效达到数量级提升的目标。在存储原位上实现计算,是真正的存算一体。


存内计算最典型的场景是为A算法提供向量矩阵乘的算子加速,目前已经在神经网络领域开展大量研究,如卷积神经网络 (ConvolutionalNeural Network,CNN)、循环神经网络 (Recurrent Neural Network,RNN)等。存内计算有望激发人工智能领域的下一波浪潮,是广义存算一体技术的攻关重点。


03

基于ReRAM的全数字化

存算一体AI大算力芯片


最近,来自之江实验室、中国工程院、国防科技大学、浙江大学等多达十二个国内外研究机构共同发表了一篇关于智能计算的论文,文中提到AI已开启大规模算力时代,预计5年后人工智能所需的计算能力将超过目前的100万倍。


算力是数字化技术持续发展的衡量标准,也是数字经济时代的核心生产力。然而随着半导体工艺接近极限,摩尔定律即将失效,算力提升也逼近了天花板,急需新架构打破局面。


亿铸科技作为存算一体AI大算力芯片的创领者,通过基于ReRAM的全数字化设计,可以真正实现高精度、大算力、超高能效比,向横在人类面前的算力挑战迈出坚实的一步。


目前大部分存算一体芯片公司都选择了基于传统存储器件做芯片设计,主要面向算力要求小、精度要求低的应用场景。而亿铸科技基于新型存储器ReRAM (RRAM) 的全数字化存算一体创新技术填补了存算一体架构应用于AI大算力领域的空白,为存算一体芯片的发展翻开了全新篇章。


根据存储器介质的不同,目前存算一体芯片的主流研发集中在传统易失性存储器,如SRAM, DRAM, 以及新型非易失性存储器,如ReRAM, PCM, MRAM与闪存等。应用于存算一体,对于不同应用场景,Flash, SRAM和以ReRAM为代表的新型存储介质各有特长。


ReRAM新型存储介质在密度、性能、功耗和工程实现等方面,综合来说比较平衡,没有短板。相比MRAM和PCRAM等其它新型存储介质,ReRAM在密度和可靠性等方面更有优势。比如密度高到一定程度之后,MRAM和PCRAM都会存在相邻单元被“磁”或“热”干扰的微缩性天花板问题。ReRAM不存在这类问题,可以完全兼容先进CMOS工艺。


另外,亿铸科技还创新性地采用了全数字化存算技术,既能解决精度问题,又能满足大算力需求,还能实现很高的能效比。


2020年,亿铸科技成立,经过全方位评估后决定以ReRAM为存储介质做存算一体芯片;2021年被业内称为ReRAM技术元年;2022年ReRAM为更多人所熟知,不仅成为了头部芯片企业的选择,更是在各大学术、产业会议上被屡次提及,ISSCC 上基于 ReRAM的存内计算方案也正在被大力推进。如今,亿铸科技选择的ReRAM存储器件从最初的“无人问津”变成了“万众瞩目”的焦点。


更重要的是,AI市场的发展将驱动ReRAM在存算一体这一方向的爆发。在存算一体赛道上,随着人工智能市场规模不断扩大,属于ReRAM的市场爆发很快就会到来。



参考来源

https://baijiahao.baidu.com/s?id=1701881536241248548&wfr=spider&for=pc

https://www.elecfans.com/consume/1989872.html



END



相关阅读




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存